Perubahan Menuju Model yang Dikalibrasi dengan Instruksi
Apa Dasarnya?
Dulu, model LLM dasar dilatih terutama untuk memprediksi kata berikutnya dalam suatu urutan berdasarkan jumlah data yang sangat besar. Namun bagi pengembang, kekuatan sebenarnya terletak pada Model LLM yang Dikalibrasi dengan Instruksi. Model-model ini disempurnakan menggunakan Pembelajaran Penguatan dari Umpan Balik Manusia (RLHF) untuk mengikuti perintah tertentu dan bertindak sebagai asisten yang membantu.
Aturan Emas:Perlakukan LLM seperti staf magang cerdas namun harfiah. Ia tidak memiliki konteks khusus Anda, jadi Anda harus menyatakan tujuan Anda secara eksplisit.
Cara Menerapkan Prinsip Utama
- Kesadaran dan Spesifikitas:Kesadaran tidak berarti singkat. Memberikan lebih banyak konteks dan menggunakan pemisah (seperti tanda backtick tiga kali atau tag XML) membantu model membedakan instruksi Anda dari data yang perlu diproses.
- Berikan Waktu kepada Model untuk Berpikir:Tugas-tugas kompleks membutuhkan rantai pemikiran. Jika Anda langsung meminta model mengambil kesimpulan, kemungkinan besar akan terjadi kesalahan penalaran. Instruksikan agar model menyelesaikan solusi sendiri terlebih dahulu.
Hindari Halusinasi
Model dapat menghasilkan informasi yang terdengar masuk akal tetapi salah. Selalu verifikasi fakta atau instruksikan model untuk menyertakan sumber untuk mengurangi risiko ini.
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>
Question 1
Why should a developer prefer an Instruction Tuned LLM over a Base LLM for building an application?
Challenge: Generating Structured Data
Apply prompting principles to format output.
You have a list of ingredients. You need to convert this list into a JSON format for a web app.
Task
Write a prompt that requests JSON output with keys for 'item' and 'quantity'. Include a condition check: If the input is not a recipe, output "No recipe detected."
Solution:
prompt = "You will be provided with text. If it contains a recipe, convert it to JSON with keys 'item' and 'quantity'. If not, write 'No recipe detected.' Text: <user_input>"